智能论文笔记

An Information-Theoretic and Contrastive Learning-based Approach for Identifying Code Statements Causing Software Vulnerability

Van Nguyen , Trung Le , Chakkrit Tantithamthavorn , John Grundy , Hung Nguyen , Seyit Camtepe , Paul Quirk , Dinh Phung

分类：人工智能 | 机器学习

2022-09-20

计算机系统的程序或功能中存在的软件漏洞是一个严重且至关重要的问题。通常，在由数百或数千个源代码语句组成的程序或功能中，只有很少的语句引起相应的漏洞。当前，在机器学习工具的协助下，专家在功能或程序级别上进行了脆弱性标签。将这种方法扩展到代码语句级别的成本更高和耗时，并且仍然是一个开放的问题。在本文中，我们提出了一种新颖的端到端深度学习方法，以识别与特定功能相关的脆弱性代码语句。受到现实世界中脆弱代码中观察到的特定结构的启发，我们首先利用相互信息来学习一组潜在变量，代表源代码语句与相应函数的漏洞的相关性。然后，我们提出了新颖的群集空间对比学习，以进一步改善与脆弱性相关的代码语句的强大选择过程。 200K+ C/C ++功能的实际数据集的实验结果表明，我们方法的优越性比其他最先进的基线相比。通常，我们的方法在无需监督的环境中在现实世界数据集上运行时，在Baselines上，VCP，VCA和TOP-10 ACC测量的较高性能在3 \％至14 \％之间。我们已发布的源代码样本可在\ href {https://github.com/vannguyennd/livuitcl} {https://github.com/vannguyennd/livuitcl。} {

translated by 谷歌翻译

Joint User and Data Detection in Grant-Free NOMA with Attention-based BiLSTM Network

Saud Khan , Salman Durrani , Muhammad Basit Shahab , Sarah J. Johnson , Seyit Camtepe

分类：机器学习

2022-09-14

我们考虑无上行赠款非正交多访问（NOMA）中的多用户检测（MUD）问题，其中访问点必须确定活动互联网（IoT）设备的总数和正确的身份他们传输的数据。我们假设IoT设备使用复杂的扩散序列并以随机访问的方式传输信息，按照爆发 - 距离模型，其中一些物联网设备以高概率在多个相邻的时间插槽中传输其数据，而另一些物联网设备在帧中仅传输一次。利用时间相关性，我们提出了一个基于注意力的双向长期记忆（BILSTM）网络来解决泥浆问题。 Bilstm网络使用前向和反向通过LSTM创建设备激活历史记录的模式，而注意机制为设备激活点提供了基本背景。通过这样做，遵循了层次途径，以在无拨款方案中检测主动设备。然后，通过利用复杂的扩散序列，对估计的活动设备进行了盲数据检测。所提出的框架不需要对设备稀疏水平和执行泥浆的通道的先验知识。结果表明，与现有的基准方案相比，提议的网络的性能更好。

translated by 谷歌翻译

An Additive Instance-Wise Approach to Multi-class Model Interpretation

Vy Vo , Van Nguyen , Trung Le , Quan Hung Tran , Gholamreza Haffari , Seyit Camtepe , Dinh Phung

分类：机器学习 | 人工智能

2022-07-07

可解释的机器学习提供了有关哪些因素推动了黑盒系统的一定预测以及是否信任高风险决策或大规模部署的洞察力。现有方法主要集中于选择解释性输入功能，这些功能遵循本地添加剂或实例方法。加性模型使用启发式采样扰动来依次学习实例特定解释器。因此，该过程效率低下，并且容易受到条件较差的样品的影响。同时，实例技术直接学习本地采样分布，并可以从其他输入中利用全球信息。但是，由于严格依赖预定义的功能，他们只能解释单一级预测并在不同设置上遇到不一致的情况。这项工作利用了这两种方法的优势，并提出了一个全球框架，用于同时学习多个目标类别的本地解释。我们还提出了一种自适应推理策略，以确定特定实例的最佳功能数量。我们的模型解释器极大地超过了忠诚的添加和实例的对应物，而在各种数据集和Black-box模型体系结构上获得了高水平的简洁性。

translated by 谷歌翻译

Transferable Graph Backdoor Attack

Shuiqiao Yang , Bao Gia Doan , Paul Montague , Olivier De Vel , Tamas Abraham , Seyit Camtepe , Damith C. Ranasinghe , Salil S. Kanhere

分类：人工智能 | 机器学习

2022-06-21

图形神经网络（GNNS）在许多图形挖掘任务中取得了巨大的成功，这些任务从消息传递策略中受益，该策略融合了局部结构和节点特征，从而为更好的图表表示学习。尽管GNN成功，并且与其他类型的深神经网络相似，但发现GNN容易受到图形结构和节点特征的不明显扰动。已经提出了许多对抗性攻击，以披露在不同的扰动策略下创建对抗性例子的GNN的脆弱性。但是，GNNS对成功后门攻击的脆弱性直到最近才显示。在本文中，我们披露了陷阱攻击，这是可转移的图形后门攻击。核心攻击原则是用基于扰动的触发器毒化训练数据集，这可以导致有效且可转移的后门攻击。图形的扰动触发是通过通过替代模型的基于梯度的得分矩阵在图形结构上执行扰动动作来生成的。与先前的作品相比，陷阱攻击在几种方面有所不同：i）利用替代图卷积网络（GCN）模型来生成基于黑盒的后门攻击的扰动触发器； ii）它产生了没有固定模式的样品特异性扰动触发器； iii）在使用锻造中毒训练数据集训练时，在GNN的背景下，攻击转移到了不同的GNN模型中。通过对四个现实世界数据集进行广泛的评估，我们证明了陷阱攻击使用四个现实世界数据集在四个不同流行的GNN中构建可转移的后门的有效性

translated by 谷歌翻译

Transformer-Based Language Models for Software Vulnerability Detection

Chandra Thapa , Seung Ick Jang , Muhammad Ejaz Ahmed , Seyit Camtepe , Josef Pieprzyk , Surya Nepal

分类：人工智能 | 机器学习

2022-04-07

基于变压器的大型语言模型在自然语言处理中表现出色。通过考虑这些模型在一个领域中获得的知识的可传递性，以及自然语言与高级编程语言（例如C/C ++）的亲密关系，这项工作研究了如何利用（大）基于变压器语言模型检测软件漏洞以及这些模型在漏洞检测任务方面的良好程度。在这方面，首先提出了一个系统的（凝聚）框架，详细介绍了源代码翻译，模型准备和推理。然后，使用具有多个漏洞的C/C ++源代码的软件漏洞数据集进行经验分析，该数据集对应于库功能调用，指针使用，数组使用情况和算术表达式。我们的经验结果证明了语言模型在脆弱性检测中的良好性能。此外，这些语言模型具有比当代模型更好的性能指标，例如F1得分，即双向长期记忆和双向封闭式复发单元。由于计算资源，平台，库和依赖项的要求，对语言模型进行实验始终是具有挑战性的。因此，本文还分析了流行的平台，以有效地微调这些模型并在选择平台时提出建议。

translated by 谷歌翻译

PublicCheck: Public Integrity Verification for Services of Run-time Deep Models

Shuo Wang , Sharif Abuadbba , Sidharth Agarwal , Kristen Moore , Ruoxi Sun , Minhui Xue , Surya Nepal , Seyit Camtepe , Salil Kanhere

分类：人工智能

2022-03-21

Existing integrity verification approaches for deep models are designed for private verification (i.e., assuming the service provider is honest, with white-box access to model parameters). However, private verification approaches do not allow model users to verify the model at run-time. Instead, they must trust the service provider, who may tamper with the verification results. In contrast, a public verification approach that considers the possibility of dishonest service providers can benefit a wider range of users. In this paper, we propose PublicCheck, a practical public integrity verification solution for services of run-time deep models. PublicCheck considers dishonest service providers, and overcomes public verification challenges of being lightweight, providing anti-counterfeiting protection, and having fingerprinting samples that appear smooth. To capture and fingerprint the inherent prediction behaviors of a run-time model, PublicCheck generates smoothly transformed and augmented encysted samples that are enclosed around the model's decision boundary while ensuring that the verification queries are indistinguishable from normal queries. PublicCheck is also applicable when knowledge of the target model is limited (e.g., with no knowledge of gradients or model parameters). A thorough evaluation of PublicCheck demonstrates the strong capability for model integrity breach detection (100% detection accuracy with less than 10 black-box API queries) against various model integrity attacks and model compression attacks. PublicCheck also demonstrates the smooth appearance, feasibility, and efficiency of generating a plethora of encysted samples for fingerprinting.

translated by 谷歌翻译

A Game-Theoretic Approach for AI-based Botnet Attack Defence

Hooman Alavizadeh , Julian Jang-Jaccard , Tansu Alpcan , Seyit A. Camtepe

分类：人工智能

2021-12-04

新一代僵尸网络利用人工智能（AI）技术来隐藏BotMasters的身份和避免检测的攻击意图。不幸的是，还没有现有的评估工具，能够评估现有防御战略对这种基于AI的僵尸攻击的有效性。在本文中，我们提出了一个顺序博弈论模型，能够分析突发策略僵尸网络攻击者和防守者可以使用达到纳什均衡（NE）的细节。当攻击者在最低攻击成本启动最大DDOS攻击时，在假设下计算实用程序功能，而后卫利用最大防御策略的最大防御策略。我们根据不同（模拟）云带大小的各种防御策略进行数值分析，与不同的攻击成功率值相关。我们的实验结果证实，国防的成功高度取决于根据仔细评估攻击率使用的防御策略数量。

translated by 谷歌翻译

SplitFed: When Federated Learning Meets Split Learning

Chandra Thapa , M. A. P. Chamikara , Seyit Camtepe , Lichao Sun

分类：机器学习

2020-04-25

联邦学习（FL）和分裂学习（SL）是两个流行的分布式机器学习方法。遵循模型到数据方案;客户培训和测试机器学习模型而不共享原始数据。由于客户端和服务器之间的机器学习模型架构，SL提供比FL更好的模型隐私。此外，分割模型使SL成为资源受限环境的更好选择。然而，由于基于中继的训练，SL表现在多个客户端的继电器训练引起的速度。在这方面，本文提出了一种名为Splitfed Learning（SFL）的新方法，该方法可分摊两种方法消除其固有缺点，以及包含差异隐私和PIXELD的精制架构配置，以增强数据隐私和模型鲁棒性。我们的分析和经验结果表明，（纯）SFL提供了类似的测试精度和通信效率，作为SL，同时每个全球时代显着降低其用于多个客户端的SL中的计算时间。此外，如SL在SL中，它的通信效率随着客户的数量而改善。此外，在扩展实验环境下进一步评估了具有隐私和鲁棒性度量的SFL的性能。

translated by 谷歌翻译